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Аннотация: В работе подробно описываются и обосновываются принципы, 
используемые для построения системы прогнозирования, рассматриваются 
прогноз верхней и нижней границ цены и её самой, а так же вероятность 
направления тренда цены. 
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1. Введение 
Прогноз цен на рынке ценных бумаг вызван необходимостью принятия 
инвестиционных решений при торговле на бирже [1]. 
Поведение биржи обычно представляют в виде временного ряда цен 
эмитентов. Простейшее формальное представление такого временного ряда 
имеет вид: 


Уи = +2, (1.1) 
(0) — компонента временного ряда, детерминированная на некотором 


интервале времени, а 2() — компонента этого ряда, которая содержит 
стохастическую составляющую. 

Под трендом обычно понимается функция у(1), «очищенная» от 
случайных составляющих, т.е. Кд). 

Выделение тренда это выявление плавно меняющейся глобальной 
закономерности поведения ряда. Предполагается, что эта закономерность 
«инерционна», т.е. сохраняет своё поведение в ближайшем будущем. На этом 
предположении построены все основные методы прогнозирования. 

При прогнозировании значительное внимание уделяется 
краткосрочному прогнозу, позволяющему быстро реагировать на ожидаемые 
изменения. Финансовое прогнозирование, в том числе краткосрочное, 
основано на анализе прошлых данных и для него используют, различные 


методы сглаживания. Выделение тренда это задача сглаживания ряда явными 
и не явными методами. 

К не явным методам можно отнести использование искусственных 
нейронных сетей, ставшее популярным последнее время [6]. Сети состоят из 
однотипных элементов — нейронов, соединенных между собой. Сеть 
необходимо предварительно «обучать» на примерах из истории временного 
ряда. С помощью автоматического усиления или ослабления межнейронных 
связей, она осуществляет правильную экстраполяцию функции многих 
переменных, описывающую рынок. 

Не потеряли свою актуальность классические методы сглаживания: 

® корреляционные методы, основанные на нахождении взаимосвязи 

между выбранными величинами [4] [7]. 

® регрессионные алгоритмы [2] [9], в которых большое значение имеет 

выбор функции, предполагая, что она будет сохраняться далее на 

некотором интервале времени и т.п. 

® По-прежнему технический анализ остается одним из наиболее 

популярных методов прогнозирования [8]. Он использует схожие 

закономерности изменения цен в прошлом, чтобы прогнозировать 
будущее поведение цен и их тренд. В техническом анализе разработан 
значительный набор аксиом, эмпирических правил и различного рода 
приемов, часто не доказанных. Они позволяют, на основе графика 
котировок, объёма торгов, а также новостной информации сделать 

эвристические заключения о дальнейшем поведении цены [11]. 

Ниже описывается предлагаемый метод прогнозирования будущих значений 
случайного временного ряда, использующий анализ его настоящих, а также 
прошлых значений. Рассматривается дискретный ряд цен на бирже, которые 
фиксируются в конкретные равномерные моменты времени. 

При выбранном кванте дискретности и заданном шаге (интервал времени 
прогнозирования) прогнозируется цена, и узкий диапазон её возможных 
колебаний на шаг вперед для любой точки оси времени. Подробно 
описываются и обосновываются принципы построения системы 
прогнозирования и принятия решения о проведении транзакции. 

Дополнительно делается прогноз поведения цен широко применяемым 
методом простого экспоненциального сглаживания. Это позволяет сравнить, а 
так же дополнительно оценить результаты прогнозирования. 

В работе используется только одна наиболее правдоподобная аксиома 
технического анализа: «история повторяется». Аксиома гласит, что события, 
которые происходят на рынке ценных бумаг, повторяются [8]. 

Действительно, большинство участников рынка, действуют в 
соответствии с ранее приобретенным опытом, что обуславливает 


повторяемость ситуаций на рынке ценных бумаг при похожих внешних 
условиях. Повторяемость событий не означает их полную идентичность 
(другой масштаб цен, отличающиеся величины подъемов и падений), однако 
внешний вид поведения цен очень похож. 


2. Предварительная обработка данных. 

Предположим, выбран необходимый шаг прогнозирования и допустим, 
что имеется временной ряд исторических данных, т.е. последовательность 
котировочных цен финансового инструмента, поступавших с биржи через 
постоянные интервалы времени (кванты дискретности). 

Ряд содержит достаточное количество значений (более 100000 точек) за 
длительный период времени. В данной работе используется временной ряд, 
содержащий цены закрытия интервалов, т.е. цены соответствующие концу 
кванта дискретности. Преобразуем ряд в рабочий временной файл длиной М, 
занося в него только значения с выбранным шагом. 

Как это часто делают, рассмотрим “скользящее окно” шириной т, которое 
перемещается по рабочему файлу, в сторону увеличения времени на единицу 
(1 шаг). При этом создаются массивы данных [х,.... Хни-1|› ГДе 7 меняется от 1 
до (№-т+1). Набор этих данных формирует так называемую траекторную 
матрицу [3], все элементы которой известные котировочные цены актива с 
выбранным шагом, а столбцы — содержимое последовательно расположенных 
окон. 


ХХ ХХ г ЛХ > Ха 
Х № - Хы т Хи 
№ обе 38 Аи 9 А (2.1) 


Столбцы имеют длину т (т << №), равную ширине окна и называются 
векторами вложения. 

Рассмотрим столбец, соответствующий текущему времени Ху. = [Хм и... 
хм |. Столбец не входит в матрицу и содержит неизвестное значение цены 
Хх-+1. Назовем его текущим вектором или столбцом. Величина Ху. | — это 
цена, которую мы прогнозируем, соответствует тому моменту, который 
наступит в конце прогнозируемого (№+Т)-го шага. 

Для получения количественных оценок попытаемся выбрать в 
траекторной матрице вектора вложения похожие на текущий столбец. 


Похожими будем называть столбцы, полностью положительно 
коррелированные между собой. 

Заметим, что создав траекторную матрицу, мы осуществили 
преобразование входного ряда, перейдя к его векторному представлению. Мы 
при этом исключили зависимости от времени, поскольку в матрице параметр 
время в явном виде не присутствует. Это означает, что после преобразования 
матрицы невозможно использовать, обычно принятые, весовые 
коэффициенты, зависящие от близости цен к текущему моменту. 


3. Разработка хэш-кода 
Краткосрочный прогноз требует быстрой реакции на изменения цен. Для 
уменьшения количества дальнейших вычислений и соответственно ускорения 
работы целесообразно уменьшить размерность матрицы, которая содержит 
тысячи столбцов, оставив в ней только похожие (полностью 

коррелированные) столбцы. 

Для нахождения похожих столбцов сконструируем специальный хэш-код. 
Создадим его так, чтобы рост или падение цены финансового инструмента в 
каждый следующий момент времени по сравнению с предыдущим изменяли 
значение хэш-кода. С этой целью, каждой точке столбца присвоим двоичный 
код (0 или 1) соответствующий знаку первой разности между ценами в 
точках: Ги (1-1). Столбец имеет т точек, поэтому каждый вектор вложения 
получит код равный десятичному эквиваленту двоичного кода, размерности 
т. Сама величина роста/падения цены при этом не существенна [12]. 

Отметим, что при длине столбца (ширине окна) 71 = 3 точки, число 
похожих (положительно коррелированных) столбцов сотни или даже тысячи, 
а при т = 10 число таких столбцов в большинстве случаев равно 0, даже при 
значительном объеме исторических данных. Поэтому реальная длина столбца 
т не должна превышать 6 - 7 точек. При длине столбца т = 7 точек 
наибольшее десятичное значение старшего бита 64 (счет от 0). Это дает 
возможность модифицировать хэш-код (для столбцов длиной т < 7) так, 
чтобы разделить участки роста, падения и постоянства цен (рост — сотни, 
падение — единицы и сохранение цен сотые доли). 

В биржевых данных всегда присутствует шум. Шум обуславливается 
небольшим количеством случайных сделок, разницей времени фиксации цен 
эмитента, задержкой в получении значения последней торговой операции, 
различиями в информации о ценах купли и продажи, а так же другими 
факторами. Создаваемый хэш-код должен частично исключить влияние 
шумовой составляющей. Для этого введём в него зону нечувствительности ДА, 
для малых отклонений цены. 


После учёта всех перечисленных изменений имеем абсолютную величину 
хэш-кода с тремя возможными значениями: 


100х2''’ И рисе(/- рысе(1-1)> А 
(01 =10.01х2'"” И | рие(1)- рисе(1-1) |< А 


—1 И рисе(Т)- рисе(1-1) <-А 
1х2 (7) (7-1) а 


где 1— номер бита в столбце, ртсе(й) -— цена в 1-ой точке столбца 


Создаваемый хэш-код должен определять направление поведения цены 
в (т-+1)-ой точке, не входящей в столбец, т.е. он должен иметь три различных 
значения для роста, падения и сохранения значения цены в этой точке (некий 
эквивалент знака). Учитывая максимальную величину модуля хэш-кода (при 
ширине окна 7 точек не превышает 12,800), в работе, как эквивалент такого 
"знака", принимается: 

- при росте цены в точке (т-+1), абсолютная величина хэш-кода 
увеличивается на 200,000 

- при падении цены абсолютная величина хэш-кода увеличивается на 
100,000, и хэш-код расположен в диапазоне от 100,000 до 200,000 

- если цена не меняется, хэш-код вектора равен своему модулю. 


| 26 +200,000 — рысе т +1)- А 
Вели Нда т рысе т | (+1) - ()| =^ 
| ВЛ + 500-909 рысе т +1)- () <—^ 


(3.2) 


Хэш-код разбивает траекторную матрицу на три сжатые матрицы. Одна 
матрица для роста цены после каждого столбца в точке «т+1», другая для 
падения в той же точке и третья при изменении цены меньше или равного ДА. 

Применение указанного хэш-кода позволяет многократно уменьшить 
размерность полученных матриц, оставив в них только полностью 
положительно коррелированные столбцы с одинаковой абсолютной 
величиной хэш-кода равного модулю хэш-кода текущего столбца. 


4. Масштабирование 
Цены в разных столбцах матриц коррелированы, но их величины могут 
значительно отличаться друг от друга. Каждый столбец матрицы это 
функция, заданная т точками, которая представляет собой реализацию 
процесса на бирже в разные промежутки времени. Следовательно, эти 


функции должны различаются между собой и отличаются от функции 
текущего столбца из-за изменения внешних условий. Для сравнения 
столбцов между собой их необходимо масштабировать, в соответствие с 
ценами в текущем столбце [5]. 
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Рис.1 Текущий вектор и коррелированный вектор (акции 1ВМ). Шаг =10. 
Цены (=$154 и =$181) в момент времени 10:30. Различаются их значения и величины 
отклонений. Цена (Ц) в точке М+1 (10:40) для текущего вектора (т =М) не известна. 


Если рассматривать столбцы как подобные, то можно ввести постоянный 
коэффициент подобия и получить отмасштабированные матрицы, в которых 
корреляция столбцов сохранится. Для каждого /-го столбца при этом 
существует свой коэффициент подобия а, . 

После модификации столбцов матриц (умножение на соответствующие 
коэффициенты), получим матрицы, в которых столбцы можно сравнивать 
между собой и с текущим вектором. 

Заметим, что более точная аппроксимация, например, линейная, 
практически незначительно улучшает точность, однако искажает корреляцию 
столбцов. 


5. Ожидаемая цена. 
Столбцы в матрицах после масштабирования похожи на текущий столбец, 
но описываются разными функциональными зависимостями. 

Реальная цена до завершения отрезка времени в один шаг, не известна. 
Однако, известны число столбцов в матрицах, Ку — для хэш-кода <, ||, К- 
для хэш-кода < -Ди К, — для хэш-кода > Д, а так же соответствующие цены 
в точках (т-+1) для всех модифицированных векторов (паттернов) в каждой из 
матриц. 

Поэтому за ожидаемую цену можно принять средние взвешенные значения 
цен в (77-1) точке по всем паттернам. 


У. ехр _ ргс(0) + р ехр _ ргс(—)+ р ехр _ ргс(+) 


Ехр _ рнсе[№М +П=—“ —- 
КРАНА. (5.1) 


где Ехр_ртсе — ожидаемая цена в (М+1) точке текущего вектора, 


а ехр_ргс — «0», «-», и «+» - цены паттернов в (т+1) точках. 


Можно так же оценить вероятность направления тренда цены в точке (№+1) 


[11]: 


-: К+ 
кое я 
К++К-+тКо 
же К- 
К+-+К_+Ко 
Ро=1 -Р+--Р- (5.2) 


р+, Р.- и ро - вероятности роста, падения или сохранения цены в точке Ху +1. 


Если какая-либо матрица пуста, т.е. не найдено паттернов соответствующих 
текущему вектору, то при хэш-коде <100,000 поиск ожидаемой цены не имеет 
смысла, поскольку цена не меняется и равна текущей цене. При пустой 
матрице и хэш-коде >100,000, нельзя определить по паттернам ожидаемую 
цену. В этом случае ожидаемой цене, присваивается значение, полученное 
линейным приближением, по всем точкам текущего вектора, методом 
наименьших квадратов. 


6. Оценка границ колебания цены. 
Возможны различные подходы к оценке границ колебания цены. 
Один из них — использование ближайших паттернов. Среди всех выбранных 
модифицированных векторов найдём вектора ближайшие по поведению к 
текущему столбцу. 

Наиболее близким будем считать тот вектор, у которого модуль 
максимального отклонения от текущего вектора во всех точках столбца - 
минимален. 

Цены в точке (т-+1) для каждого из 2-х ближайших паттернов (для 
роста цены и её падения), известны! Естественно предположить что, цена 
каждого из этих ближайших паттернов в (1+1) точке будет оценкой 
ожидаемой цены. 

Оценки по ближайшим паттернам, образуют сравнительно узкую 
трубку отклонений от реальной цены, и используются в программе. 


Графики ближайших паттернов в точке локального минимума и 
поведение цены представлены на Рис.2 и Рис.3. 
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Рис.2 ААРГ. Ближайшие паттерны, как для роста, так и для падения ожидаемой цены. 
Окно = 6 точек. Тте 11:21, яер = 5 пит. Точка - реальная цена в 7-ой точке. 
Падение ожидаемой цены паттерн № 137, рост её в 7-ой точке паттерн № 124 


Для получения более точного прогноза границ колебания цены, 
учитывающего шум, следует расширить оценки по ближайшим паттернам на 
0.01 — 0.02%. 
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Рис.3 Графики цен и границ их колебаний для ААРГ от 12/16/2020 
Цена в момент времени 11:21достигает локального минимума (см.Рис.2). 


Получаются мало отличающиеся прогнозы границ, если использовать 
другие критерии близости абсолютные отклонения в последних 3 точках или 
среднеквадратические отклонения. 

Обратите внимание, что оценка границ не связана с получением 
ожидаемой цены. 

Полученные и приведенные на Рис.Зоценки являются условными 
границами, это означают, что реальная цена может их пересекать, хотя 
последнее — маловероятно. 


Границы колебаний ожидаемой цены внешне напоминают широко 
известный индикатор «полоса Боллинджера» [10], хотя не имеют с ним 
ничего общего. Они позволяют оценить поведение и волатильность 
цены не постфактум, как в случае «полосы Боллинджера», а на шаг вперед. 

Прогноз цены и ее границы появляются одновременно (задержка для 
расчетов крайне мала) с соответствующими значениями текущей цены. 
Однако на совмещённом графике «цена-прогноз» точи значений прогноза и 
границ смещены вправо на один шаг относительно текущей цены. 


7. Некоторые особенности работы программы прогноза. 
Программа использует окно из 6 точек, а квант дискретности составляет 
одну минуту. 

В начале работы программы исторический файл расширяются данными 
предыдущего дня, чтобы уменьшить скачек цен между текущей ценой 
открытия и давней ценой закрытия, хранящейся в историческом файле. 

Далее он преобразуются в рабочий файл программы с заданным шагом, и 
создается соответствующий ему файл хэш-кодов. 

Все эти предварительные операции выполняются до начала 
прогнозирования, поэтому не требуют времени во время вычисления 
значений прогноза. 

Рабочий файл и файл хэш-кода в процессе работы следует обязательно 
модифицировать, добавляя в них данные текущего дня. Поясним это 
утверждение. 

Предположим, например, что при открытии биржи произошло 
значительное падение цены по сравнению с ценой закрытия предыдущего 
дня, внесенной в рабочий файл. Пусть за всё время торгов цена текущего дня 
не превысила эту цену закрытия. Если не вносить новые данные в рабочую 
информацию, то при получении хэш-кода будут использоваться (11-1) 
значений цены предыдущего дня и цена текущего дня, которая всегда меньше 
цены закрытия, т.е. хэш-код не будет меняться. 

При получении первой цены дня текущий вектор заполняться ценами 
предыдущего дня. Они рассматриваются как цены дня пришедшие ранее. 
Между ценой закрытия предыдущего дня и ценой открытия текущего обычно 
существует скачек, поэтому появляется дополнительная ошибка прогноза. В 
дальнейшем текущий вектор будет постепенно заполняться новыми ценами, а 
число цен предыдущего дня будет уменьшаться, следовательно, ошибка 
прогноза, обуславливаемая этим скачком, будет падать. 

Программа использует рабочие массивы исторических данных с 
заданным шагом. Этот же шаг должен сохраняться и в текущем векторе, когда 
он заполняется данными текущего дня. Поскольку в текущем векторе данные 


дня шаг за шагом замещают исторические данные, через 6 шагов (ширина 
окна в нашем случае равна 6 точкам) в векторе полностью исчезнут 
исторические данные. В этом случае вектор будет содержать шесть цен дня, а 
прогноз будет давать ожидаемое значение на шаг вперед. Через минуту (1 
квант времени) придет новое значение цены и в текущий вектор будут 
занесены уже новые, смещенные на один квант цены дня, поскольку прогноз 
осуществляется на момент, соответствующий следующей, смещенной на 
минуту, цене. При этом процесс повторится. 

Описанный процесс будет повторяться все время, пока не будет 
получен сигнал об окончании данных дня. 

После завершения очередного шаг, заданного пользователем, рабочий 
массив исторических данных пополняется новым значением. Внутри шага 
рабочие массивы не меняются. 

Если поступающие со входа данные имеют пропуски, т.е. пропущены 
какие-либо моменты времени, то программа заполнит пропуски путем 
интерполяции. 

В каждый момент времени рассматриваются три возможных значения 
хэш-кода, соответствующие сохранению, падению и росту цены. Для каждого 
из них производятся необходимые вычисления. Описанный алгоритм 
выполняется для любой новой цены текущего дня. 

Чтобы границы колебания ожидаемой цены были плавными и более 
удобными для использования их желательно частично сгладить. В программе 
используется сглаживание границ путем усреднения по 3 точкам. 
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Рис.4 М5$ЕТ от 01/03/2023 шаг 5 мин 


Полученный прогноз, как и всякий прогноз, может давать погрешность. 
Для подтверждения результатов желательно получить прогноз ожидаемых 
цен независимым принципиально другим методом. Для этой цели подходит, 


например, широко используемый метод простого экспоненциального 
сглаживания, который дополнительно включен в программу [12]. 


8. Экспоненциальное сглаживание 
Обычно простое экспоненциальное сглаживание с прогнозом на шаг 
вперед осуществляют по известной формуле Брауна: 


он = Вху, +(1-В)хъ, (8.1) 


где 5,.,— прогнозируемое значение, у,- текущее значение ряда, 
5, — предыдущий прогноз, а В-— коэффициент сглаживания (0< В <1). 


От величины р зависит, насколько быстро при прогнозе снижается вес цен 
предшествующих текущей. Если р = 1, сглаживания вовсе не осуществляется 
и полученный ряд полностью повторяет исходный. 
В качестве начального значения прогноза (5,) в программе выбрано первое 
значение цены (5, = уо) дня. Тогда, при любом р, 5, = у,(эквивалентно сдвигу 
вправо), т.е. прогноз равен первой цене дня (счет от 0). Возникающая при 
этом начальная ошибка прогноза быстро падает с увеличением числа шагов. 
Величина /, как и другие параметры, задается в конфигурационном файле. 
При том же шаге прогноз, полученный методом экспоненциального 
сглаживания, позволяет подтвердить результат предыдущего прогноза или 
хотя бы направление тренда. График прогноза методом экспоненциального 
сглаживания выводится одновременно с описанным выше прогнозом. Для 
совмещения графиков предложенного и экспоненциального прогнозов в 
последнем проводится линейная интерполяция внутри каждого шага между 
прогнозируемыми точками. 
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Рис.5 ГТС от 12/16/2020 шаг 5 мин 


В отличие от описанного выше прогноза, при экспоненциальном 
сглаживании, прогнозируемые значения появляются только в момент 
соответствующий заданному шагу, т.е. прогноз на графике осуществляется 
как бы скачками. Линейная интерполяция внутри каждого шага обеспечивает 
сглаживание этого графика. 


Заключение 
Отметим, что в описанной программе на самом деле осуществляются 
три независимых прогноза. Кроме экспоненциального сглаживания и 
прогнозом цены по средне взвешенным значениям всех паттернов. Прогнозом 
цены является ничего общего не имеющая с ними средняя линия границ, 
полученных по ближайшим паттернам. 

Все основные параметры программы (длина временного интервала 
прогноза, величина зоны нечувствительности и другие) можно легко 
изменять, они задаются в конфигурационном файле программы. 

Используя описанные программы с двумя разными значениями шага 
прогноза, можно дать прогноз, самой цены, границ её колебания и тренда с 
достаточно высокой точностью. 

Так же возможна частичная автоматизация процесса торговли, т.е. подача 
сигналов рекомендации покупать, или продавать при близких значениях 
направления тренда для выбранных шагов и результатов каждого из 
прогнозов. 

Заметим, что если прогноз достаточно хороший и сглаживания нет, то при 
не большем шаге (3 — 5 квантов дискретности) и относительно спокойном 
рынке отклонения прогноза от текущих цен малы, и график прогноза очень 
похож на график цен, но сдвинут вправо. По мере увеличения шага это 
сходство постепенно исчезает. 

Разработанная программа позволяет проводить вычисления, а также 
выводить графическую информацию в реальном времени. 

При принятии решений рекомендуется учитывать не только, полученные 
результаты, но и новостную информацию, и любые другие привычные и 
удобные для трейдера биржевые индикаторы. 

За счет применения хэш-кода программа работает чрезвычайно быстро 
и даже при небольших квантах дискретности время выполнения программы 
не накладывает никаких ограничений, поэтому описанный прогнозирующий 
индикатор, по нашему мнению, может найти применение в системах 
высокочастотной торговли. 
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